序列建模導論：資料、順序與時間動態

在人工智慧領域中，序列建模將重點從靜態的快照轉移到時間流。標準機器學習任務通常假設資料點是 獨立且同分布（IID），表示樣本的順序不會影響結果。

序列建模明確拒絕此觀點，專注於三大核心支柱：

違反排列不變性：在表格資料中，欄位順序是任意的。在序列中，順序是主要特徵。將「The cat ate the rat」換成「The rat ate the cat」會根本性地改變 語義基礎真實 即使詞彙相同。
自回歸特性：我們假設時間 $t$ 的觀測值在數學上取決於其歷史（$t-1, t-2, \dots, 1$）。這需要轉移機率來捕捉資訊如何演變。
可變長度映射：與固定 28x28 像素網格不同，像句子或地震波這樣的序列是 彈性的。模型必須處理長度為 $N$ 的輸入並產生長度為 $M$ 的輸出，同時使用一致的參數。